【科研小技能】样本量计算的理论

您所在的位置：网站首页 › 李伟民{ }贴吧 › 【科研小技能】样本量计算的理论

【科研小技能】样本量计算的理论

2024-01-15 16:15| 来源: 网络整理| 查看: 265

图2 CONSORT 声明

样品量计算所需要的的参数

确定样本量的大小，实际上就是选择在研究结束时可能获得显著性差异所需要的最少观察人数。可根据科研假设的目的和测量参数性质，选择相应的软件程序或公式来计算。而软件程序或公式中就需要有相应的参数填进去，不然没法计算。那么这些参数是什么？从哪儿来？想必此时大家会有诸多的疑问，下面我们便结合图3，具体了解样本量计算所涉及到的参数。

图3 样本量计算参数1

研究目的是计算样本量首先需要考虑的问题。此处通过举例来加深大家理解。评价一种新的治疗措施的效果往往需要以某已知的有效治疗措施作为对照。如果试验组疗效为A ，对照组疗效为B ，通常会假设A=B ，即将A-B 与0 作比较，这是最常用的差异性检验。如果将A-B 与一个既定的值Δ 进行比较，此时就根据研究设计类型不同而产生了4 种假设类型4 ：1. 优效性假设检验，研究的干预措施效果将优于对照组；2. 等效性假设检验，研究的干预措施效果将等于对照组；3. 非劣效性假设检验，研究的干预措施效果将非劣于对照组；4. 生物等效性假设检验，旨在评价制剂间药代动力学参数的平均水平及个体内变异是否等效。

计算样本量还需要考虑研究的主要终点指标。因为不同的终点指标，将会需要不同的样本量来达到研究期望的把握度；另外，在有限的资源、精力及预算条件下，只允许完成某个限定样本量的研究，那么如何选择一个终点指标，才能有效地回答研究问题就很重要。所以，选取合适的终点指标可以提高研究的成功率。

那么，终点指标都有哪些类型呢？一般来讲，有三种类型5 ：连续变量，如糖化血红蛋白（HbA 1c）较基线的变化、空腹血糖较基线的变化等；二分类变量，如HbA 1c控制是否达标、是否有低血糖发生等；还有一类，时依性变量，比如在降糖药物的心血管结局试验中，除了心血管死亡、非致死性心肌梗死或非致死性卒中发生与否之外，还需要结合事件的发生时间。

在计算样本量的时候，必须要考虑I类错误和II类错误的大小6 。那么什么是I类错误和II类错误呢？Ⅰ类错误α又叫拒真错误，即本来原假设是正确的，而根据样本得出的统计量的值落入了拒绝域，根据检验拒绝了正确的原假设（图4 A）。举个例子，某降糖药疗效确切，你却说它无效，这时候你就犯错误了，这个概率往往是≤5%。其实每次的差异有统计学意义的结论，我们都在允许自己犯错误，只是这种错误的概率即检验水准越低越好。α即犯I类错误的概率大小，该值越小，所需样本量越大。

Ⅱ类错误β 又叫纳伪错误，即本来原假设是错误的，而根据样本得出的统计量的值落入了接受域，根据检验接受了错误的原假设（图4 B ）。举个例子，某降糖药无效，你却说它疗效确切，这时候你就犯错误了，这个概率往往在10%-20% 。而把握度（检验效能）则是1-β ，可理解为如果某降糖药无效，就有把握度的概率在本次研究中将其检验出来，此概率越高越好。β 值越小，检验效能越大，所需样本量越大。

图4 I 类错误（A ）和II 类错误（B ）

计算样本量还需要设定效应值，效应值就是总体中的关联强度7 。举例说明，效应值就是当活性药和对照药疗效不同时，预期活性药的效果会比对照药好多少。如果是数值变量时，可以是有临床意义的试验前后之差、均数差值等；如果是分类资料，可以是有临床意义的患病率、有效率等率之差，还可以是相关系数、比值比（OR ）、风险比（HR ）等。

可通过前期临床试验的结果或已发表文献获取效应值，当有多个参考结果时，需通过Meta 分析来估计效应值。如果是非劣效、等效、优效性假设检验，即是选择对应的界值，例如：比较降糖药物降低HbA 1c效果的非劣效性试验的界值，欧洲药品管理局（EMA ）规定在0.3% ，美国食品药品监督管理局（FDA ）规定在0.3%-0.4% ；2008 年FDA 规定新型降糖药物心血管风险评估非劣效性试验的界值，HR 值95% 置信区间的上限必须小于1.8 （上市前）、1.3 （上市后）。

除效应值之外，变异大小也会对样本量产生影响。该值通常参照已发表的与当前研究具有类似的试验设计、研究人群及分析方法的文献获取。具体而言，对于数值变量指标，需考虑总体标准差，可用样本标准差代替；对于分类变量指标，需考虑总体率，一般选取对照组或非暴露组人群的事件发生率；对于时依性变量指标，需结合事件的发生时间考虑事件发生率。

根据统计学方法估计出的样本量是在给定条件下满足临床试验所需的最小样本量。实际试验过程中，由于研究对象的脱落、退出及依从性差等原因，会导致可评价研究对象数的减少，需要在样本量计算时加以考虑8,9 。比如，从LEADER 研究最终流程（图5 ）上来看，利拉鲁肽组有3% 的研究对象脱落，安慰剂对照组有3.4% 的研究对象脱落10 。

图5 LEADER 研究最终流程

此外，其它参数，诸如生存分析试验设计中研究人群的入组时间及随访时间也会影响到研究的样本量，也需要在样本量计算时予以考虑11 。

看过上文样本量计算的理论，估计很多人已经摩拳擦掌、跃跃欲试了，不要急，下期便会与大家一起探讨样本量计算的实际应用，敬请期待！

参考文献

1. Kenneth F Schulz, et al. Lancet. 2005; 365(9467):1348-1353.

2. Ellen J Weber, et al. Emerg Med J. 2018;35(12):755-756.

3. D Moher, et al. Lancet. 2001;357(9263):1191-1194.

4. Laura Flight, et al. Pharm Stat. 2016; 15(1):68-74.

5. Elise Whitley, et al. Crit Care. 2002;6(4):335-341.

6. Laura Flight, et al. Pharm Stat. 2016;15(1):68-74.

7. Hae-Young Kim.Restor Dent Endod. 2015; 40(4):328-331.

8. Janet Wittes. Epidemiol Rev. 2002; 24(1):39-53.

9. Kenneth F Schulz, et al.Lancet. 2002; 359(9308):781-785.

10. Marso SP, et al. N Engl J Med. 2016;375(4):311-322.

《科研小技能》介绍：

诺和诺德医学事务团队结合自身的工作经验与对临床科研工作的理解，总结出关于统计学、演讲技巧、幻灯片制作技巧等交流内容，旨在提升临床老师的综合职业能力。返回搜狐，查看更多

【本文地址】

【科研小技能】样本量计算的理论

【科研小技能】样本量计算的理论

今日新闻

推荐新闻